Analyse automatique de textes par un Systeme d'etats finis
نویسندگان
چکیده
Toute proc6dure de reconnaissance ou de g6n6ration automatique de langues naturelles, c'est-~t-dire toute proc6dure qui fair passer d'un niveau de langue ~t un autre niveau, repose sur la notion de module. Le module lui-m~me comporte deux facettes, l'une est le type logique caract6ris6 par une classe de languages reconnus et traduits, l'autre, est le contenu concret des donndes linguistiques destin6es la repr6sentation d'une langue particuli~re. Le type logique du module valable pour plusieurs langues est concr6tis6 par un syst~me informatique contenant le m6talangage d'dcriture de la grammaire et des diverses donn6es et contenant aussi l'algorithme d'exploitation de ces donn6es. Le syst~me A.T.E.r., d6crit en d6tail par ailleurs, est tin support informatique permettant la reconnaissance et la transduction des langages d'6tats-finis. I1 ne constitue 6videmment qu'un maillon dans une chalne de modules texte-signification ou signification-texte (en traduction automatique par exemple) et d'autres modules plus puissants sont n~cessaires. Cependant, l'analyse de langues naturelles qui n'exige pas une puissance sup6rieure est d~j~t appr6ciable. En effet, elle comprend l'analyse morphologique et tree partie de l'analyse syntaxique. Pour r6aliser ces t,~ches, un syst~me d'6tats-finis est 6videmment beaucoup plus efficace qu'un syst~me trop puissant. Ainsi le syst~me A.T.E.F. est principalement utilis6 pour l'identification des roots, l'analyse morphologique et le d6but d'une analyse syntaxique de langue naturelle. Un tel texte se pr6sente sous la forme d'tme suite de caract~res o~.l le ~ blanc ~)joue le r61e particulier de s6parateur de formes. Ces formes constituent k leur tour les 616ments d'entr6e du module. L'dtape de morphologie dolt permettre leur substitution par des quantitds significatives pour le module suivant.
منابع مشابه
Extraction automatique de connaissances pour la décision multicritère. (Automatic Knowledge Extraction pour Multicriteria Decision Making)
Cette application, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision, en particulier la phase d’apprentissage en faisant de la connaissance actionnable (CA) une entité informatique manipulable par des algorithmes. La connaissance est extraite directement...
متن کاملLogiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité
Résumé. La compréhension de textes de spécialité nécessite un étiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textes étudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d’utiliser un étiquetage réalisé par un étiqueteur généraliste, puis d’améliorer cet éti...
متن کاملExploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes
Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme ca...
متن کاملRésumé automatique de texte avec un algorithme d'ordonnancement
Résumé: Dans cet article, nous proposons une nouvelle approche pour le résumé automatique de textes utilisant un algorithme d'apprentissage numérique spécifique à la tâche d'ordonnancement. L'objectif est d'extraire les phrases d'un document qui sont les plus représentatives de son contenu. Pour se faire, chaque phrase d'un document est représentée par un vecteur de scores de pertinence, où cha...
متن کاملPronoun Anaphora Resolution for Automatic Correction of Grammatical Errors (Correction automatique par résolution d'anaphores pronominales) [in French]
Résumé. Cet article décrit des travaux réalisés dans le cadre du développement du correcteur automatique d’un logiciel commercial d’aide à la rédaction du français. Nous voulons corriger des erreurs uniquement détectables lorsque l’antécédent de certains pronoms est connu. Nous décrivons un algorithme de résolution des anaphores pronominales intraet interphrastiques s’appuyant peu sur la corres...
متن کامل